Epoch 15 - 行人重識別論文筆記 x AANet - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

第 12 屆 iThome 鐵人賽

DAY 15

AI & Data

AI x 日常 x 30天系列第 15 篇

Epoch 15 - 行人重識別論文筆記 x AANet

12th鐵人賽

AlittleQ

2020-09-25 22:24:28

1228 瀏覽

分享至

今天介紹這篇也是經典的reid論文，

AANet: Attribute Attention Network for Person Re-Identifications

有些研究表明，結合語義訊息（如：身體部位，人體姿態等）可以顯著提高Reid的準確率。
但是目前SOTA的Reid方法中並沒有用到人體屬性資訊，如：衣服顏色、頭髮長短、性別等，
而這些attribute在短時間內不會發生顯著變化，因此可以作為一些線索提高Reid性能。

因此本篇文章，提出了Attribute Attention Network (AANet) 框架，將person attribute融合到分類框架中。
該模型包含3個子網絡。
第一個網絡稱為Global Feature Networks(GFN)，一般作法，用來擷取全身特徵進行分類。
第二個網絡稱為Part Feature Network (PFN)，類似PCB，關注於身體局部區域檢測，分塊抽取特徵。
第三個網絡稱為Attribute Feature Network(AFN)，從行人身體上抽取多層次的屬性信息構成Attribute Attention Map (AAM)。

這三個網絡使用行人ID和屬性標籤進行分類，計算Loss，因為這是一個Multi-Task Learning，
必須保證所有任務同等重要，而不能讓簡單任務主導整個訓練過程。

主要重點在AFN，AFN包含兩個子任務：
(1)人體屬性分類
(2)attribute attention map (AAM)的生成
首先第一個任務會分別預測12個屬性的分類。
然後第二個任務用第一個任務的output，經過CAM，得到每個屬性attention map，最後組合成 AAM，如圖所示